智能论文笔记

StereoVoxelNet: Real-Time Obstacle Detection Based on Occupancy Voxels from a Stereo Camera Using Deep Neural Networks

Hongyu Li , Zhengang Li , Neset Unver Akmandor , Huaizu Jiang , Yanzhi Wang , Taskin Padir

分类：机器人 | 计算机视觉

2022-09-18

障碍物检测是机器人导航中的一个安全问题，即立体声匹配是一种流行的基于视觉的方法。尽管深度神经网络在计算机视觉中显示出令人印象深刻的结果，但以前的大多数障碍物检测都仅利用传统的立体声匹配技术来满足实时反馈的计算限制。本文提出了一种计算高效的方法，该方法利用深度神经网络直接从立体声图像中检测占用率。我们的方法没有从立体声数据中学习点云对应，而是根据体积表示提取紧凑的障碍物分布。此外，我们根据解码器产生的OCTREES以粗到1的方式修剪安全空间的计算。结果，我们在机载计算机上实现实时性能（NVIDIA JETSON TX2）。我们的方法可检测到32米的范围准确的障碍，并以最先进的立体声模型的计算成本的2％的计算成本获得了更好的IOU（相交）和CD（倒角距离）。此外，我们通过使用真实机器人进行自主导航实验来验证方法的鲁棒性和现实世界的可行性。因此，我们的工作有助于缩小机器人感知中基于立体声的系统与计算机视觉中最新的立体声模型之间的差距。为了应对高质量的现实世界立体声数据集的稀缺性，我们收集了一个1.36小时的立体声数据集，该数据集用jackal机器人来微调我们的模型。数据集，代码和更多可视化可在https://lhy.xyz/stereovoxelnet/上获得

translated by 谷歌翻译

Pregrasp Object Material Classification by a Novel Gripper Design with Integrated Spectroscopy

Nathaniel Hanson , Tarik Kelestemur , Deniz Erdogmus , Taskin Padir

分类：机器人

2022-07-03

机器人从能够根据其材料属性进行对象进行分类或操纵对象而受益。这种能力可通过适当的抓握姿势和力选择来确保对复杂物体进行精细操纵。先前的工作集中在触觉或视觉处理上，以确定掌握时间的材料类型。在这项工作中，我们介绍了一种新型的平行机器人抓地力设计，以及一种从握把手指内收集光谱读数和视觉图像的方法。我们训练非线性支持向量机（SVM），该机器可以通过递归估计将要抓住的物体的材料分类，并且随着从指尖到物体的距离降低的距离，置信度越来越高。为了验证硬件设计和分类方法，我们从16种真实和假水果品种（由聚苯乙烯/塑料组成）中收集样品，从而导致一个包含光谱曲线，场景图像和高分辨率纹理图像的数据集，因为对象被掌握，提起并释放。我们的建模方法证明了在32类决策问题中对对象进行分类时的准确性为96.4％。这比最先进的计算机视觉算法的状态在区分视觉上相似的材料方面提高了29.4％。与先前的工作相反，我们的递归估计模型解释了频谱信号强度的增加，并允许随着抓手接近对象做出决策。我们得出的结论是，光谱法是使机器人不仅能够对握住的对象进行分类，还可以理解其潜在的材料组成。

translated by 谷歌翻译

Multimodal Fusion of EMG and Vision for Human Grasp Intent Inference in Prosthetic Hand Control

Mehrshad Zandigohar , Mo Han , Mohammadreza Sharif , Sezen Yagmur Gunay , Mariusz P. Furmanek , Mathew Yarossi , Paolo Bonato , Cagdas Onal , Taskin Padir , Deniz Erdogmus

分类：机器人 | 人工智能 | 计算机视觉

2021-04-08

目的：对于下臂截肢者，机器人假肢承诺将重新获得日常生活活动的能力。基于生理信号（例如肌电图（EMG））的当前控制方法容易由于运动伪影，肌肉疲劳等导致不良的推理结果。视觉传感器是有关环境状态的主要信息来源，可以在推断可行和预期的手势中发挥至关重要的作用。但是，视觉证据也容易受到其自身的伪像，最常由于对象阻塞，照明变化等。使用生理和视觉传感器测量的多模式证据融合是一种自然方法，这是由于这些模态的互补优势。方法：在本文中，我们提出了一个贝叶斯证据融合框架，用于使用眼部视频，眼睛凝视和来自神经网络模型处理前臂的EMG的掌握意图推理。当手接近对象以掌握对象时，我们将个人和融合性能分析为时间的函数。为此，我们还开发了新颖的数据处理和增强技术来训练神经网络组件。结果：我们的结果表明，相对于EMG和视觉证据，平均而言，融合会提高即将到来的GRASP类型分类准确性，而在触及阶段则提高了13.66％和14.8％的融合，从而单独地和视觉证据，总体融合精度为95.3％。结论：我们的实验数据分析表明，EMG和视觉证据表明互补的强度，因此，多模式证据的融合可以在任何给定时间胜过每个单独的证据方式。

translated by 谷歌翻译

Graph Embedding via High Dimensional Model Representation for Hyperspectral Images

Gulsen Taskin , Gustau Camps-Valls

分类：计算机视觉 | 机器学习

2021-11-29

学习遥感图像的歧管结构对于建模和理解过程是最重要的相关性，以及封装在减少一组信息特征中的高维度，以用于后续分类，回归或解密。歧管学习方法显示出优异的性能来处理高光谱图像（HSI）分析，但除非专门设计，否则它们不能提供明确的嵌入式地图，容易适用于采样超出数据。处理问题的常见假设是高维输入空间和（通常低）潜空间之间的转换是线性的。这是一种特别强烈的假设，特别是当由于数据的众所周知的非线性性质而处理高光谱图像时。为了解决这个问题，提出了一种基于高维模型表示（HDMR）的歧管学习方法，这使得能够将非线性嵌入功能呈现给潜伏空间的采样外部样本。将所提出的方法与其线性对应物一起进行比较，并在代表性齐谱图像的分类精度方面实现了有希望的性能。

translated by 谷歌翻译

Machine Learning-Based Assessment of Energy Behavior of RC Shear Walls

Berkay Topaloglu , Gulsen Taskin Kaya , Fatih Sutcu , Zeynep Tuna Deger

分类：机器学习

2021-11-16

目前的地震设计代码主要依赖于结构构件的强度和位移能力，并且不考虑地面运动持续时间或滞后行为特征的影响。基于能量的方法用作响应量的补充指标，包括重复载荷在地震性能中的效果。设计理念表明，结构构件的能量耗散能力满足了地震要求。因此，应当很好地理解结构构件的能量耗散行为，以实现有效的基于能量的设计方法。本研究重点介绍钢筋混凝土（RC）剪切墙的能量耗散能力，这些剪切壁广泛用于高地震区，因为它们提供了抗侧向力的显着刚度和强度。基于机器学习（高斯过程回归（GPR））的剪力墙能量耗散能力的预测模型是墙面设计参数的函数。显示十八个设计参数来影响能量耗散，而最重要的是通过施加顺序向后消除并通过使用特征选择方法来确定预测模型的复杂性来确定。所提出的模型使稳健和准确的预测的能力基于具有预测精度的新数据（预测/实际值的比率）约为1.00的新数据和0.93的确定系数（R2）。本研究的结果被认为是（i）的基于能量的方法（i）限定了剪力墙地震能量耗散能力的最有影响力的墙壁性能和（ii）提供了能够实现不同墙体设计配置的比较的预测模型实现更高的能量耗散能力。

translated by 谷歌翻译